智能交互 - 智狐AI导航

CogAgent

CogAgent是一款由清华大学与智谱AI联合开发的多模态视觉大模型，专注于图形用户界面（GUI）的理解与导航。它具备视觉问答、视觉定位、GUI Agent、高分辨率图像处理及多模态能力，可应用于自动化测试、智能交互、多模态人工智能应用开发、企业级AI Agent平台等多个领域。CogAgent在多个基准测试中表现出色，尤其在GUI操作数据集上显著超越现有模型。

AI项目与工具 2025年06月12日 66 点赞 0 评论 743 浏览

Perplexica

Perplexica是一款开源的AI驱动搜索引擎，支持多模式搜索（如全网、学术、视频等），兼容本地大型语言模型，具备强大的自然语言理解和实时信息更新能力。适用于个人、学术、企业和教育场景，帮助用户高效获取所需信息。

AI项目与工具 2025年06月12日 65 点赞 0 评论 859 浏览

悦灵犀AI

悦灵犀AI是一款基于先进AI技术的创作平台，支持文生图、文生视频、背景替换、证件照生成及照片修复等多种功能。其智能助手和丰富工具使用户能够高效创作艺术作品，并广泛应用于艺术设计、广告营销、教育等领域。

AI项目与工具 2025年06月12日 51 点赞 0 评论 973 浏览

CosyVoice 2.0

CosyVoice 2.0是一款基于深度学习的语音生成大模型，通过有限标量量化技术和新型架构设计，在发音准确性、音色一致性和韵律表达方面表现出色。其支持流式推理，延迟低至150ms，广泛应用于智能助手、有声读物、视频配音及语言学习等领域，同时具备多语言支持和情感控制等功能。

AI项目与工具 2025年06月12日 10 点赞 0 评论 725 浏览

11x

11X是一款基于AI技术打造的数字员工服务平台，主要功能涵盖自动化销售流程、跨渠道客户互动以及多语言支持等。其核心产品Alice和Mike分别负责潜在客户挖掘与沟通安排、电话销售与客户跟进，助力企业实现高效运营。平台支持25种语言，适用于多种业务场景，包括销售自动化、客户服务、市场推广及语言翻译等。

AI项目与工具 2025年06月12日 66 点赞 0 评论 899 浏览

Ola

Ola是一款由多机构联合开发的全模态语言模型，支持文本、图像、视频和音频等多种输入形式。通过渐进式模态对齐策略，逐步扩展模型的多模态理解能力，同时采用流式解码技术提升交互体验。其架构融合多种编码器与解码器，结合局部-全局注意力机制，实现高效多模态处理，在多项任务中表现优异。

AI项目与工具 2025年06月12日 98 点赞 0 评论 777 浏览

HiveChat

HiveChat 是一款面向中小团队的 AI 聊天工具，支持多款主流 AI 模型，具备文本交互、图像理解、LaTeX/Markdown 渲染等功能。系统基于 React 构建，支持多种部署方式，适用于企业沟通、学术研究、内容创作等场景，提供高效、便捷的智能协作体验。

AI项目与工具 2025年06月12日 28 点赞 0 评论 730 浏览

AppAgentX

AppAgentX是西湖大学开发的智能GUI代理框架，通过记忆和进化机制优化手机交互效率。它能自动归纳高效操作模式，减少重复计算，支持跨应用复杂任务。基于视觉识别，无需API即可通用操作，适用于自动化任务、智能助手、企业流程等领域。在多项测试中表现优异，为智能代理技术提供新思路。

AI项目与工具 2025年06月12日 28 点赞 0 评论 688 浏览

理想同学网页版

理想同学网页版是一款由理想汽车推出的AI智能助手，集成DeepSeek R1/V3 671B满血版模型，支持多模型切换、联网搜索、图像识别等功能。用户可通过文字、长文本或图片进行交互，支持360°视觉追踪，提升交互体验。适用于办公、学习、多设备协同等场景，支持网页与移动端同步，打造无缝智能服务生态。

AI项目与工具 2025年06月12日 44 点赞 0 评论 633 浏览

InternVL3

InternVL3是上海人工智能实验室推出的多模态大型语言模型，具备文本、图像、视频等多模态数据处理能力。采用原生多模态预训练方法，提升语言与视觉理解效率，并支持工具使用、3D视觉、工业图像分析等复杂任务。模型可通过API部署，适用于智能交互、图像识别、视频分析及客服系统等多种场景。

AI项目与工具 2025年06月11日 68 点赞 0 评论 629 浏览

智能交互

首页

智能交互

列表

默认

浏览次数

发布日期